英特尔IT:OpenStack带来的架构演变
前几天编译了《英特尔将17000个VMware虚拟机迁移到OpenStack,效果惊人》这篇文章,是今天文章的解读版,有读者反馈解读有偏差,所以我们今天把报告编译了,供各位参考。
本文有三位作者:
格雷格·邦斯(GregBunce),英特尔公司英特尔IT基础设施技术团队的自动化及企业集成负责人
凯西·卡恰托雷(KathyCacciatore),OpenStack基金会的咨询营销经理
斯里德哈·马汉卡里(SridharMahankali),英特尔公司英特尔IT基础设施技术团队的云架构师
企业组织总是在不断完善IT基础设施以满足新的要求,英特尔就是如此。英特尔的计算环境支持全球95200名员工,包括61个数据中心和147000个设备。为了给英特尔创造尽可能大的业务价值,IT部门积极投入并实施创新的IT战略和能力,包括云计算、IT消费化和大数据分析。
2009年,英特尔IT旗下的托管部门实施了私有云,以托管办公、企业和服务应用程序。这个最初的私有云方案基于其发展迅猛的虚拟化项目。没有任何现成的工作流程自动化技术可以满足英特尔IT的要求,于是他们构建了自己的自动化框架,用于编排必要的接口。
英特尔已获得了重大好处,这得益于它部署自己的私有云,提高了敏捷性――服务器配置时间从90天缩短到短短30分钟,并且降低了运营成本――自2009年以来省下了2100万美元。
英特尔IT定制的自动和自助式前端系统提高了敏捷性和生产力,支持成千上万的用户,不过他们想要做得更多,以应对更艰巨的挑战,把握更重大的机会。
英特尔需要满足以下五个方面的要求:
托管效率和效果
灵活性和用户体验
缩短产品上市的时间
混合云就绪性
功能与预算
托管效率和效果:
英特尔从2010年的91个数据中心精简为2015年的61个数据中心,这在很大程度上是由于,在同一期间,服务器虚拟化占工作负载的比重由42%提高到80%。最初实施云就是这个转变的一部分。
除了合并和按需自助服务外,他们还特别指出,开发人员在生产环境经常使用的资源比实际所需的更多。英特尔IT的团队知道,现有的自助式配置无法让传统的企业工作负载在性质上更像云。
灵活性和用户体验:由于环境复杂,并不是英特尔IT的每个托管环境都拥有自助式配置自动化技术,导致大量的人工服务请求。比如说,2014年,他们有8000多个日常服务请求,大约有一半请求磁盘空间或其他类型的虚拟机大小调整请求。他们得出了结论,私有云和额外的自助式功能有望减少这些人工服务请求,同时加快服务交付。
缩短产品上市的时间:他们的产品小组和开发人员要求IT跟上业务部门的速度。英特尔IT重视开发人员对于应用程序及用户的深入了解。从概念环节到生产环节,它需要一种更好的方法来支持开发人员,缩短创造价值的时间,并且提高竞争力。
混合云就绪性:他们的开发人员重视AWS等公共云提供商提供的即时性,这让开发团队能够尝试概念、快速叫停,以及迅速从开发环节进入到生产环节。从基础设施服务的角度来看,英特尔IT知道,他们不仅要交付与第三方云服务提供商不相上下的功能,还要像零售云服务提供商那样运营――如果它要实现长远的混合云愿景,更是如此。
功能与预算:他们的预算面临压力,他们需要额外的功能才能应对增长。他们认定,要充分利用自动化,学会信任自动化,并增加可以由单一管理员管理的基础设施的比例。简而言之,英特尔知道,他们需要一种将硬件局限性抽象出去的软件定义基础设施,在降低成本的同时让内部用户能够加快工作、合并基础设施,并且尽量减小管理开销。
除了挑战和机会外,他们还要满足另外几个需求。
由于有成千上万的传统虚拟机,加上自己拥有广泛的专长,他们不想非得将基础设施推倒重来。他们认识到,一些应用程序需要该基础设施具有的成熟功能,但是其他应用程序与替代的虚拟机管理程序和编排环境也许可以顺畅地协同运行。
由于预算问题,他们还需要支持众多厂商提供的众多现有的物理基础设施,而不是将硬件推倒重来。托管部门的物理基础设施包括:
计算:一级服务器
存储:主要是一级中档光纤通道,设计环境还有广泛的NFS
物理网络:众多的一级交换机
他们不得不支持一系列广泛的工作负载,从开发/测试到生产、对内对外的工作负载以及Windows和Linux工作负载。
任何解决方案都要与开发方法相一致。它需要面向敏捷方法、开发运维(DevOps)、持续集成/持续部署(CI/CD)以及平台即服务(PaaS)。
他们探究了两条路子,以应对面临的挑战和需求。
商业解决方案
OpenStack
他们熟悉市面上的商业方案,但是英特尔在OpenStack方面也有经验。2011年,他们有一个使用场合已定义的内部客户,发觉有机会加快开发速度。为了满足这个要求,他们成功地试用了绿场部署的OpenStack,该OpenStack后来演变成了功能完备的OpenStack/KVM基础设施,用于支持新的应用程序。一些开发人员能够将现有的“非云”Windows工作负载从原始云迁移到绿场环境。因而,IT变得习惯用OpenStack来管理使用多虚拟机管理程序的云。
这番经历表明了OpenStack自动化具有的价值,而自动化是克服挑战、满足转型目标的关键。最重要的是,他们知道,OpenStack可以完全交付软件定义数据中心,结合PaaS,就能在提供竞争优势的同时,克服挑战。
英特尔有一个宏伟的目标。在今后两年,英特尔旨在构建一个覆盖整个企业的混合云,完全不亚于一级云服务提供商提供的解决方案。英特尔正从当前状态向开放架构转型。为了实现这个目标,他们采用了分三个阶段的方法,从当前状态向终极目标转变。
英特尔IT托管部门的第一个转型阶段
第一阶段主要致力于跨生产环境的控制平面部署,改用OpenStack,以便相比现有的遗留云基础设施,大大提升服务消费者的能力。
通过迁移到OpenStack,英特尔停掉了为最初的私有云开发的定制自动化技术,同时提供经过改进的自助功能。他们还有一个不同的OpenStack控制平面,服务于绿场部署的KVM和Ceph,用于配置对内对外的工作负载。
在这个阶段期间,他们将推广OpenStack控制平面,在之前没有自助服务的托管业务部门,将新的虚拟机配置换为自助模式。这最终会停用每个地方的内部自定义配置功能。
面向消费者的自助功能包括:
到2015年年底,第二阶段的堆栈添加到第一阶段的控制平面上(图2),完成了迁离自定义私有云架构的工作。第二阶段需要把所有现有实例的元数据导入到OpenStack控制平面,合并系统,并提升自助式功能。他们目前在大规模运行该架构,结合了相当多的开发和生产工作负载,去年完成了17000多个完整的创建/使用/销毁生命周期:7000多个KVM虚拟机和10000多个ESXi虚拟机。
面向ESXi和KVM虚拟机的通用OpenStack控制平面
到2016年年底,他们打算进入到第三阶段,到时他们将拥有一种完全自动化的架构,尽量减少人工服务请求:旨在即时满足90%的服务请求。到第三阶段,这个企业私有云将高度依赖开放标准和开源技术。第三阶段代表着英特尔向联合、互操作、开放的混合云这条道路迈出下一步。它将支持PaaS、容器和自动化混合云配置,以便最大限度地提高可扩展性、灵活性和价值。
英特尔目前在大规模地运行Grizzly+Havana,正迁移到Juno。他们在使用所有主要的OpenStack服务,正在测试Trove和Ceilometer。
除了OpenStack外,他们还在使用:
CloudFoundry,用于平台即服务
Puppet和一些Ansible,用于基础设施自动化――英特尔在Puppet方面拥有广泛专长
名为Shrinken的Nagios分支,用于基础设施监控
一款内部开发的工具,用于便于权限批准和租户/配额设置
OpenvSwitch(OVS)和专有插件,用于网络虚拟化
除了基本的基础设施转型外,他们还在现有的OpenStack部署环境中使用Horizon。他们的做法是API优先,最频繁使用的主要是API用户。对青睐用户界面(UI)的那些用户而言,Horizon让英特尔IT可以尽量减少UI方面的投入,同时仍提供卓越的用户体验。
他们很快认识到,发展之路不是从一种技术转为另一种技术;而是以一种新的方式,运用之前获得的技能(开发运维、敏捷方法和持续集成/持续部署)。他们有意改造了组织体系,让虚拟化团队了解各学科的知识,以便构建和运营控制平面。转型常常归结为换新思路――从瀑布开发变成敏捷开发,从人工构建变成自动化,变成编写脚本或Puppet清单文件,而不是编制说明文档。不是招聘新的员工或使用异地培训,现有员工在岗学习。
英特尔找到了减少资源使用的机会。比如说,大约40%的应用程序环境是多年的稳定工作负载;60%具有更大的临时性,比如生产环节前的开发、测试及其他使用场合。英特尔认识到,在成本最高昂的基础设施上运行临时工作负载不明智,这些工作负载在第二阶段的活动中导入到控制平面后,对它们进行分区,并对实例采取租赁的方法。
他们还要竭力实施混合云,使用纯粹的OpenStack,以支持快速扩展和工作负载突增。如今,其中一些最终用户使用多个公共云。英特尔IT托管部门充当云中介,负责重新路由,将公共云的使用限制在合适的使用场合。将来,在一些情况下,把工作负载放在公共云上更明智――不大重要或可能猜测性的工作负载尤其如此,本地计算容量是为了满足优先级更高的要求。
社区对英特尔来说很重要;作为OpenStack基金会的白金成员,英特尔公司将开发资源贡献给OpenStack项目。英特尔IT托管部门预测将来可能需要自定义开发,他们积极地将实用的改进贡献给社区。
OpenStack让英特尔的IT托管部门能够向高层管理人员展示一条清晰的为期多年的道路,以克服挑战、实现目标。集成工作按计划顺利进行,生产环境路线图方向对头。
他们正在逐渐实现这些好处:
缩减IT资源――采用的手段有两个:一是通过由独立数据库转为数据库即服务解决方案,消除2750个虚拟机;二是通过第二阶段迁移、合并和租赁,缩减虚拟机占用空间。
减少人工干预--2014年,托管部门处理了8400次人工服务请求,这些请求相当于为等待请求得到处理花了大约190000个小时。通过在2015年部署OpenStack控制平面架构,以及第二阶段导入遗留实例元数据,英特尔IT部门预测可借助自动化实现这个目标:80%的日常服务请求可立即得到处理。到2016年年底,第三阶段完成后,英特尔IT部门期望实现90%的目标。
加快进入市场――由于是一个开源项目,OpenStack可直接控制业务部门需要的功能,而且在应用程序/服务开发、交付和运营方面具有前瞻性。非常有利于OpenStack的因素包括:它面向敏捷开发、开发运维以及持续集成/持续部署(CI/CD)。
自动化――在这方面,OpenStack扎根于开源社区给英特尔IT部门带来了回报,因为它是一种由API定义的开放自动化平台。英特尔IT托管团队能够充分利用OpenStack社区使用的同一套工具链,用于开发、构建、验证和部署其数据中心操作系统。这直接相当于加快了英特尔IT部门交付的速度,并且改善了大规模运行环境的总体质量和效率。
优化混合云――英特尔IT托管部门的2016年目标就是,实现公共云和私有云使用的自动化,那样应用程序可以根据业务要求和工作负载需求,迁移到最终云。借助OpenStack以及借助基于CloudFoundry的PaaS解决方案,英特尔IT部门在提高用户的工作效率,让它能够将私有云的价值扩大到额外的小组和使用场合,因而支持技术路线图,从而利用混合云(私有云和公共云),进一步提高可扩展性和成本效益。
数据中心最佳实践――借助从这次转型获得的经验,英特尔IT托管部门在软件定义基础设施方面的最佳实践与英特尔公司的客户和OpenStack社区实现了共享。
功能与预算――虽然拥有效率方面的种种好处、进入市场方面有优势、提高了计算机利用率以及自动化运营,但英特尔预计还能在降低成本的情况下大大提升功能。
在第三阶段,他们最终会有一个基于OpenStack而建的环境,混合使用虚拟机管理程序、商品化IP存储系统和软件定义网络。从长远来看,他们看到其方法会得到进一步演进,到时会看到额外的服务交付模式变得更为普遍,包括PaaS、DBaaS、SaaS、MaaS+容器等模式。
总的说来,由于是一个开源项目,OpenStack可直接控制英特尔IT托管部门需要的功能。就应用程序/服务开发、交付和运营而言,OpenStack非常具有前瞻性,让英特尔能够设想并追逐长远目标,又没有毫无必要的复杂性。
云头条编译|未经授权谢绝转载
欢迎加入,群主微信:aclood